import pandas as pd

# 加载数据集
data = pd.read_csv("C:\\Users\\董柳蕙\\Downloads\\heart.csv")

# 检查分类变量的缺失值并进行可视化
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

# 识别分类变量（假设值种类少于等于10的变量为分类变量）
categorical_columns = [col for col in data.columns if data[col].nunique() <= 10]

# 计算分类变量的缺失值
missing_values = data[categorical_columns].isnull().sum()

# 创建缺失值的可视化
plt.figure(figsize=(10, 6))
missing_values.plot(kind='bar', color='skyblue', alpha=0.8)
plt.title("分类变量缺失值数量", fontsize=16)
plt.xlabel("变量名称", fontsize=14)
plt.ylabel("缺失值数量", fontsize=14)
plt.xticks(rotation=45)
plt.grid(axis='y', linestyle='--', alpha=0.7)
plt.tight_layout()
plt.show()
